구글의 프로젝트 아스트라, 베오, 그리고 제미니 업그레이드 전투 AI 진전
이것은 구글의 오픈AI에 대한 응답입니다.
일상적으로 진정으로 사용될 수 있는 일반 AI, 지금처럼 이런 모습이 아니라면 기자회견을 하는 것이 부끄러울 것입니다.
5월 15일 새벽, 연례 "기술 세계의 봄 축제 갈라" 구글 I/O 개발자 회의가 공식적으로 시작되었습니다. 110분의 주요 기조연설에서 인공지능이 몇 번이나 언급되었는지 구글이 세어 보았습니다:

네, AI는 매 분마다 언급되고 있습니다.
생성적 AI의 경쟁이 최근 새로운 절정에 도달하였고, 이번 I/O 회의의 내용은 자연스럽게 인공지능을 중심으로 돌아갔습니다.
"1년 전 이 무대에서, 우리는 네이티브 다중 모달 대형 모델인 제미니에 대한 계획을 처음으로 공유했습니다. 이는 I/O의 새로운 세대를 의미합니다," 구글 CEO 순다르 피차이는 말했습니다. "오늘, 우리는 모두가 제미니의 기술로 혜택을 받을 수 있기를 바랍니다. 이러한 혁신적인 기능은 검색, 이미지, 생산성 도구, 안드로이드 시스템 등 여러 분야에 침투할 것입니다."
현재, 1.5 프로와 1.5 플래시가 공개 미리보기로 제공되며, 구글 AI 스튜디오 및 버텍스 AI에서 100만 토큰의 컨텍스트 윈도우를 제공합니다. 이제 1.5 프로는 API를 사용하는 개발자와 구글 클라우드 고객을 위해 대기 명단을 통해 200만 토큰의 컨텍스트 윈도우도 제공합니다.

또한, 제미니 나노는 순수 텍스트 입력에서 이미지 입력으로 확장되었습니다. 올해 말, 픽셀을 시작으로 구글은 다중 모달 제미니 나노를 출시할 것입니다. 이는 모바일 사용자가 텍스트 입력뿐 아니라 시각, 소리 및 음성 언어와 같은 더 많은 맥락 정보를 이해할 수 있음을 의미합니다.
제미니 가족에 새로운 멤버가 추가되었습니다: 제미니 1.5 플래시

새로운 1.5 플래시는 속도와 효율성을 위해 최적화되었습니다.
신세대 오픈 소스 대형 모델 제마 2
오늘, 구글은 오픈 소스 대형 모델 제마에 대한 일련의 업데이트를 발표했습니다. – 제마 2가 등장했습니다.
소개된 바와 같이, 제마 2는 획기적인 성능과 효율성을 달성하기 위한 새로운 아키텍처를 활용하며, 새로운 오픈 소스 모델 파라미터는 27B입니다.

긴 동영상에 관해서, 베오는 60초 또는 그 이상의 동영상을 생성할 수 있습니다. 단일 프롬프트 또는 함께 이야기를 전하는 일련의 프롬프트를 제공하여 이를 수행할 수 있습니다. 이는 영화 및 텔레비전 제작에서 비디오 생성 모델의 응용에 중요한 요소입니다.
베오는 구글의 비주얼 콘텐츠 생성 작업을 기반으로 하며, 여기에는 생성적 쿼리 네트워크(GQN), DVD-GAN, 이미지-비디오, 페나키, WALT, 비디오 포엣, 루미에르 등이 포함됩니다.
